查看原文
其他

最新成果|用深度学习预知城市未来人流量

慧眼&中规院 百度地图慧眼 2019-09-13


【百度慧眼中规院联合创新实验室】是百度地图慧眼与中国城市规划设计研究院共建的联合实验室。双方发挥各自的资源、技术优势,形成一系列具有行业前瞻性、实用性的研究成果,并促进研究成果的转化与应用。双方联合研究的领域包括:城镇化发展动态监控与政策支持、城市空间诊断、评估与模拟、人工智能与城市智慧管理、城市空间决策支持与业务咨询等。


往期成果


城市中的“炼金术” ——探析混合用地的奥秘

北京和上海的副中心建设成效分析

用户通勤方式挖掘及其空间特征浅析

基于百度大数据的全国城市重要性评价和城镇化分区划定
基于短期人口流动数据的全国城市群识别研究

东北三省短期人口迁徙主要流向的识别


最新研究成果:

用深度学习预知城市未来人流量


作者简介:

阚长城 百度地图资深研发工程师

马琦伟 中国城市规划设计研究院学术信息中心博士


前言


作为一名常年与城市规划和管理打交道的从业人员,笔者对漫威旗下超级英雄奇异博士的时间宝石眼红不已。在最新上映的《复仇者联盟3》中,奇异博士凭借此宝推演了超级英雄们与灭霸的14000605次交锋,并发现了唯一的成功之法。看完此片后笔者浮想联翩:如果在城市发展中我们也能拥有时间宝石,根据当下的情况预知未来一段时间内的发展走势,那城市管理者手中无疑将增加一件强大的工具。


当前的技术还不能支撑我们如此的全知全能,但在业内相关研究成果[1]的基础上,联合实验室最新的成果却已迈出了第一步——根据实时获取的人流量数据,预测未来整个城市范围内不同地区一小时后的人口流入流出变化情况。


可以预见,基于这一成果部署城市的人流量监控和预警平台,可以有效地提高城市的运行效率,更有力地保障城市公共安全。在这一技术的支持下,管理部门可以提前预知因各类公共事件和突发事件引起的人流快速聚集,从而提前做好相应的疏导、管控和限流等应急预案,最大限度地降低由此带来的负面影响。


研究方法





研究范围与数据


本研究的范围为北京市区,划分为1公里×1公里的网格。


人流量的统计数据源为百度位置服务数据,来自百度地图开放平台的去隐私化定位数据。


人流量预测面临的挑战


预测城市中每一个地区的人流量变化是一个复杂的工程,其关键要点主要在于对以下三个方面特征的把握:


兼顾时间变化的连续性、差异性和周期性


任一地区的人流量变化从时间角度来看一般是连续的,即后一时刻的人流量与前一时刻的人流量关联性最强,而随着时间间隔的增大,两个时刻之间的人流量相关性会逐渐变小。下图展示了一个典型居住区域和一个典型工作区域的人流量时间变化曲线,可以看到两条曲线均较为平滑,体现了上述的连续变化特征,而我们的模型需要抓住这一特征。


同时从图中我们还能看到,居住区域的人流量变化曲线与工作区域的人流量变化曲线迥异,我们的模型同样需要体现此种差异性。

另一个时间维度上的重要特征是周期性。从下方的图 2和图 3可以明显看出,无论是工作区域的人流量变化还是居住区域的人流量变化,均呈现明显的周期性变化特征。更加复杂的是,这种周期性在不同的时间尺度下还会有所差别:以天为单位观察,我们能看到每天人口从早到晚的涨落;以周为单位观察,我们能看到工作日和周末的明显差异;以年为单位观察,则又能看到四季气候与节假日对人流量的影响。


在人流量预测中,对于复杂的周期性特征也需要予以体现。


 考虑空间相关性


任何的人流集聚都具有空间相关性:一场社区联欢会能吸引本社区和附近社区的市民参加,一个跨年倒计时可能吸引周边地区乃至全城的人流,一场明星演唱会则会吸引从本市到周边城市乃至全国歌迷的涌入。


这要求我们在预测人流量变化时须具备全局眼光,不仅考虑本地区的人流变化,也要通盘考虑周边更大范围内的人流动向。


考虑各类外部因素影响


毫无疑问,城市日常运行节奏中如果加入外部因素,则城市的人流量时空变化将会产生突变。图 4展示了北京市某地区在长假期间与工作日的人流量变化差异性,节假日的人流量激增现象明显。图 5则展示了极端天气对人流量的影响,由于极端天气一般持续时间相对较短,其影响也显得更加微妙而难以把握。

在人流量变化预测的三个关键点中,外部因素的影响需引起重视,这是因为准确把握外部因素对人流的作用是提前化解人口异常集聚问题的前提条件,也是人流量预测的核心价值所在。


小结


      以上三个关键点是准确预测人流量时空变化的基础,但传统预测方法中要同时兼顾三者的难度相当大。本研究引入深度学习方法,借助深度残差网络,取得了更好的效果。


基于深度残差网络的人流量预测方法


在深度残差网络中,我们通过以下三项策略来解决上述的三个关键问题。

1.通过逐步输入长时间训练数据来反映时间的连续性、差异性和周期性

通过分步输入不同的时间尺度下的人流量分布数据,深度残差网络可以同时实现时间变化的连续性、差异性和周期性。


具体而言,首先把最近几帧的数据放到残差网络的模型中,来模拟一天内相邻时间点上人流量的平稳变化;然后将前几天同一时刻的数据输入到中间的模型,来模拟以天为单位的时间周期性;再将过去几周同一时刻的数据输入到左侧的残差网络模型,来模拟以周为单位的时间周期性;然后对结果进行融合。


2.通过不断“扩大视野”来感知不同空间尺度的人流变化

在深度残差网络中,通过大量次数的卷积计算来捕捉空间相关性。在此我们不必深究卷积计算的含义,而是可以将其视为我们观察城市人流变化的“视野”。当进行一次卷积计算时,相当于我们观察了研究地点周边的人流变化;而反复进行卷积计算则意味着我们不断扩大我们的“视野”,从而观察了从周边地区到片区、乃至整个城市的人流量变化情况。


由此,我们的分析也可以较准确的把握各种尺度下人流量的空间分布相关性。


3.通过融合外部因素来模拟异常情况

在把握时空特征的基础上,我们进而将节假日、极端天气、大型公共活动等各类外部因素与神经网络进行结构融合。


通过上述的方法,我们成功训练了一个深度残差网络,接下去我们将对其预测的效果进行检验和评估。


效果检验


城市层面的预测效果评估


下面两个图对比了2018年工作日某一天早上07:00-09:00早高峰时段的实际人流量时空分布变化和我们的预测结果。从图中展示的结果来看,我们的模型较好地把握了人流量变化的内在时空特征,并进行了相当高精度的预测。


图 9展示了在早上08:00预测值与真实值之间的误差及其空间分布情况,为方便读者观察,柱体高度均为实际误差值的10倍。总体而言,绝大部分地区的误差值保持在一个可接受的范围内。误差相对较大的地区一部分是人流量较大的地区,另一部分则是存在少量偶发性人流量的地区,特别是城市边缘地区。

图 7 实际07:00-09:00人流量变化图

图 8 预测07:00-09:00人流量变化图


从总体的误差度分布情况来看,我们可以看到大部分网格损失小于10%,超过80%的网格损失在20%以内。这进一步印证了深度残差网络在人流量预测中的有效性。


 局部层面的预测效果评估


在全局预测效果评估的基础上,我们进一步对一些人流量较大的重点地区和重点事件进行评估。


周期性人口集聚现象的预测


下图展示了上地华联地区的人流量预测情况及其与真实值之间的比对关系。从曲线走势可以看到,总体上预测值与真实值的符合度比较高,损失值的时间分布没有明显的趋势性,表明造成预测误差的一个重要原因可能是随机因素的影响。


对回龙观地铁站的人流量预测结果也具有类似的特征。由图中可以看到我们训练的模型对地铁人流高峰期的人流量预测是较为精准的,这表明本模型可以在地铁人流预测和预警中发挥较好的作用。


 突发性人口集聚现象的预测


商场和地铁站的人流量时空分布相对周期性比较强,其预测难度相对低一些。真正的挑战则是对非常规的公共活动的识别和预测。


此处我们利用训练好的模型对5.20号林俊杰演唱会期间的人流量进行预测,并将该特殊时刻的预测精确度与平时工作日的预测精度进行对比。


从结果来看,我们的模型仍然准确识别了人流量的异常集聚,并进行了较高精度的预测,这表明本模型在大型公共活动、突发事件等异常情况的预测和预警中也可以发挥较好的预见性。


与平时某天的预测结果进行对比表明,在演唱会期间人流量激增、且基数增加较多的情况下,相应的预测精确度仅略有下降,模型的表现较能令人满意。


结语


人流量预测对城市规划管理和城市公共安全具有重要的作用,本研究立足深度学习技术,构建深度残差网络模型,并对模型的实际预测效果进行了系统的检验。检验结果表明,我们的模型可以较好地将人流量预测中的时间相关性、空间相关性、外部因素三个关键问题综合考虑,预测精度达到较为先进的水平。


未来通过进一步的优化和部署,本研究结果可以在城市动态监测和应急管理等领域发挥重要的作用。


[1] Zhang J, Zheng Y, Qi D. Deep Spatio-Temporal Residual Networks for Citywide Crowd Flows Prediction[C]//AAAI. 2017: 1655-1661.

    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存